from llama_index.readers.wikipedia import WikipediaReader
from llama_index.core import SimpleDirectoryReader# 本地PDF解析（解决中文乱码）
# 维基百科数据接入
wiki_docs = WikipediaReader().load_data(pages=["Artificial Intelligence"])
for i, doc in enumerate(wiki_docs, 1):
    print(f"=== 文档 {i} 内容 ===")
    if doc.metadata.get("title"):
        print(f"标题: {doc.metadata['title']}")
    print(f"内容: {doc.text[:1000]}...")
